ANALIZA „DYLEMATU WIĘŹN IA” Z WYKORZYSTANIEM 
KOMPLEKSÓW REGUŁ 


Ewa ROSZKOWSKA! 


1. Wstęp 


„Dylemat więźnia” jest najczęściej badaną oraz wykorzystywaną grą w na- 
ukach ekonomicznych i społecznych. Opisuje on sytuacje społeczne i gospodar- 
cze, z jakimi spotykamy się w rzeczywistości, prezentuje niektóre uwarunkowania 
interakcji między graczami prowadzące do przewrotnych skutków. Rozważana 
jest sytuacja, w której dwie strony mogą uzyskać obopólnie korzystny wynik, 
współpracując. Jednak obawa przed egoistycznym zachowaniem partnera 1 chęć 
maksymalizacji własnych korzyści skłania często strony do wyboru zachowania 
rywalizacyjnego, co w konsekwencji prowadzi do gorszego rezultatu. Jak zauważa 
P.D. Straffin: „Jednostki racjonalnie dbające o swoje interesy doprowadzają do 
wyniku niekorzystnego dla wszystkich, w tym 1 dla nich samych” [22, s. 95]. 

Problem decyzyjny dotyczący konfliktu między racjonalnością indywidualną 
1 grupową może pojawić się także w kontekście analizy szans 1 zagrożeń związa- 
nych ze wstąpieniem Polski do UE. Czasem sytuacja narzuca pytanie: jak spo- 
łeczność może zapewnić sobie, aby każdy z jej członków uznał zasadę dobra 
ogólnego za podstawę swojego indywidualnego działania, czyli aby interes ogól- 
ny stał się tożsamy z interesem własnym? Problemy te sprowadzają się do zastą- 
pienia indywidualnej perspektywy postrzegania sytuacji perspektywą społeczną, 
a w konsekwencji znalezienia właściwej motywacji przekształcenia strategii opar- 
tej na interesie własnym w strategię opartą na interesie wspólnym. 

„Iterowany dylemat więźnia” wskazuje, że w perspektywie długofalowych 
kontaktów korzystne jest stosowanie strategii wet za wet, czyli zawsze zaczynaj 
od współpracy, a następnie powielaj posunięcia drugiej strony. Strategia ta nie 
jest wredna 1 egoistyczna, choć także nie jest naiwna, gdyż rewanżuje się za nie- 
czyste zagrania 

W pracy opiszemy „dylemat więźnia” z wykorzystaniem kompleksów reguł 
oraz przeprowadzimy analizę rozwiązań tej gry ze względu na relacje społeczne 
między stronami, kolejność wykonywania ruchów, możliwość komunikacji. 
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2. Charakterystyka gry „dylemat więźnia” 


„Dylemat więźnia” jest to gra wymyślona przez dwóch pracowników RAND 
Corporation M. Dreshera i M. Fooda w 1950 roku. Dopiero później A.W. Tucker 
uzupełnił tę grę historyjką, od której wzięła swoją nazwę — „dylemat więźnia”. Na- 
zwa gry pochodzi od sytuacji, gdy prokurator wzywa dwóch podejrzanych 
o wspólne popełnienie przestępstwa. Jeżeli żaden z nich nie przyzna się do winy, to 
obaj zostaną skazani na niski wyrok za drobne przestępstwa, które można im 
udowodnić. Jeśli jeden z nich pójdzie na współpracę z prokuratorem i przyzna się, 
zostanie zwolniony, a drugi podejrzany dostanie duży wyrok. Jeśli obaj przyznają 
się, to otrzymają średni wyrok. Problem jest następujący: niezależnie od postępo- 
wania partnera opłaca się zeznawać. Jednak w przypadku, gdy żadna ze stron nie 
zeznaje, wynik jest o wiele lepszy dla obu graczy. Zatem wybór podyktowany inte- 
resem osobistym nie zawsze jest najlepszy dla danego gracza. 

„Dylemat więźnia” jest jedną z 78 podstawowych gier dwuosobowych opisa- 
nych przez A. Rapoporta, M. Guyera 1 D. Gordona. Zakłada się, że gracze czy- 
nią swoje wybory jednocześnie i brak jest możliwości komunikowania się. 
Mamy dwie strategie: współpracy (W) 1 rywalizacji (R) [16]. Strategia współ- 
pracy polega na szukaniu porozumienia za cenę rezygnacji z własnych intere- 
sów, a rywalizacyjna na dążeniu do maksymalnej realizacji własnych interesów 
kosztem drugiej strony, czasem nawet za cenę porażki obu stron. Z perspektywy 
gracza mogą wystąpić następujące wyniki: 

— Nagroda (/V) za współpracę, jeśli obaj zastosują strategię W; 

— Pokusa (P) do odniesienia jednostronnego zwycięstwa, jeśli na strategię 

R drugi z nich odpowie strategią W; 

— Zagrożenie (Z), jeśli na strategię W gracza I gracz II odpowie strategią R; 

— Kara (K), jeśli obaj zastosują strategię R 1 spowoduje to konflikt. 

Hierarchia preferencji gracza uwzględnia cztery elementy: współpraca, zwy- 
cięstwo, porażka, konflikt. „Dylemat więźnia” jest grą symetryczną, w której 
obaj gracze mają następującą hierarchię preferencji: jednostronne zwycięstwo, 
współpraca, konflikt, jednostronna porażka (PNKZ — Pokusa, Nagroda, Kara, 
Zagrożenie). Macierz wypłat opisana jest za pomocą tabeli 1. 


Tabela 1. Macierz gry „dylemat więźnia” (PNKZ) 


Gracz I 


a<b<c<d 


2 : r o . ZE: A í i 
Ciekawe omówienie „dylematu więźnia” oraz innych gier dwuosobowych wraz z ich zastosowa- 
niem w naukach ekonomicznych zawierają prace: [15, s. 209-256; 9; 14; 20; 23; 18; 19]. 
3 ` ź i. 5 3 . è RY: è > 
Czasem zakłada się również, że 2c>a+b, co oznacza, że suma „uniewinnień” powinna być 
większa od sumy pełnego wymiaru kary i „zachęty do zdrady”. 
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Poszczególne rozwiązania gry mają różny wydźwięk dla obu graczy, podkre- 
ślają jednocześnie problem: czy starać się zminimalizować straty i uzyskać na- 
grodę, przyjmując, że drugi również będzie tak rozumował? Partner jest jednak 
wystawiony na pokusę uzyskania lepszego rozwiązania, jeśli dopuści się jedno- 
stronnej zdrady. Gracz zdaje sobie sprawę, że partner myśli podobnie, nie może 
więc założyć, że druga osoba zaryzykuje pójściem na współpracę. Efektem ta- 
kiego rozumowania jest wynik niekorzystny dla obu stron (K). Jest to jednak re- 
zultat lepszy, niż w przypadku gdyby gracz ryzykował, idąc na współpracę i zos- 
tał zdradzony (Z). 

Gracze, postępując zgodnie z racjonalnością indywidualistyczną, doprowadzają 
do najmniej korzystnego rezultatu (R,R), który jest równowagą Nasha w tej grze. 
Postępowanie zgodnie z zasadą racjonalności społecznej prowadzi do wyniku 
(W,W) optymalnego w sensie Pareto, który jest korzystniejszy dla obu graczy, 
ale nieracjonalny indywidualnie". 

Liczne badania „dylematu więźnia” pokazują, że najczęściej wybierane są 
strategie rywalizacyjne, przy czym wybór strategii jest uzależniony od struktury 
wypłat macierzy gry, zależności między stronami, nastawienia psychicznego, in- 
formacji o liczbie powtórzeń gry [4; 11; 12, s. 58-58; 15 s. 229-249; 22, s. 94- 
105, s. 178-190]. 

Rozpatrując „dylemat więźnia” z punktu widzenia konfliktu między racjo- 
nalnością indywidualna a społeczną, R. Luce i H. Raiffa stwierdzają, że gry tego 
typu powinny być wręcz zabronione [13 s.97]. T. Burns, L. Meeker sugerują 
zmianę postaw graczy tak, aby preferowane były reguły racjonalności społecznej 
[4]. Inne możliwe rozwiązania to na przykład ustanowienie władzy lub stosun- 
ków dominacji między graczami, zmiana macierzy gry, łapówki. Jednym z po- 
pularnych rozwiązań jest dobrowolne przyjęcie na siebie kary w przypadku, gdy 
zerwie się współpracę, drugi natomiast będzie współpracował. 

Możemy analizować grę „dylemat więźnia”, gdy jeden z graczy wykonuje 
ruch jako pierwszy, a my mamy możliwość ustalania posunięć przed ich wyko- 
naniem. Komunikacja między graczami, stosowanie nacisku w postaci gróźb i obiet- 
nic jest dozwolone lub gra jest rozgrywana wielokrotnie. Komunikacja może 
dotyczyć zarówno pierwszego ruchu, jak i kolejnych. T. Schelling wyróżnił trzy 
rodzaje ruchów strategicznych, które mogą być wykonywane samodzielnie lub 
łączone [21; 22, s. 109-119]. Są to: zobowiązania, groźby oraz obietnice. 

Zobowiązanie to jednostronna deklaracja podjęcia przez gracza określonego 
działania. 

Groźba to deklaracja, że w przypadku podjęcia określonego działania przez 
drugą stronę, gracz sam podejmie działanie, które: 

1. będzie niekorzystne dla drugiej strony; 


* Para strategii jest równowagą Nasha, jeśli żaden z graczy przy założeniu wyboru drugiej strony 
nie pragnie dokonywać zmiany wyboru strategii. Optymalny układ strategii w sensie Pareto ozna- 
cza, że gracze nie mogą polepszyć swojej sytuacji, nie pogarszając jednocześnie sytuacji pozosta- 
łych graczy. 
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2. będzie niekorzystne dla niego. 

Obietnica to deklaracja, że w przypadku podjęcia określonego działania 
przez drugą stronę, gracz sam podejmie działanie, które: 

l. będzie korzystne dla drugiej strony; 

2. będzie niekorzystne dla niego. 

Zauważmy, że zarówno obietnica, jak i groźba to zobowiązania warunkowe. 
Na przeszkodzie wiarygodności groźby lub obietnicy stoi warunek (ii). Jeśli bo- 
wiem groźba lub obietnica nie zostaną potraktowane poważnie, gracz nie ma 
motywacji do ich dotrzymania. W sytuacji, gdy spełni obietnicę lub groźbę, nie 
ma to już żadnego wpływu na wynik, ale sam ponosi stratę. Problemem jest 
przekonanie gracza, że podejmie działanie szkodliwe dla siebie w sytuacji, gdy 
żadne zmiany już są niemożliwe. T. Schelling podaje różne sposoby budowania 
wiarygodności. Może to być obniżenie jednej lub kilku wypłat, danie słowa ho- 
noru, podpisanie prawnie wiążącego oświadczenia. 

W pojedynczej grze o schemacie „dylematu więźnia” groźba nie ma sensu 
(posunięcie rywalizacyjne jest itak racjonalne dla obu partnerów). Sensowna 
natomiast jest obietnica: „odpowiem współpracą na twoją współpracę”, która 
daje szansę na uzyskanie obopólnych korzyści. Jednak zauważmy, że nawet wte- 
dy możliwość jednostronnie korzystnego rozwiązania i chęć zdominowania part- 
nera mogą spowodować, że ulegniemy pokusie zdrady. Zdarza się to i w prakty- 
ce (niewywiązanie się z ustaleń, niedotrzymanie ustnej umowy, torpedowanie 
współpracy ). 

W sytuacji, gdy gra jest rozgrywana wielokrotnie, czyli mamy tzw. „iterowany 
dylemat więźnia”, zysk z zerwania współpracy jest o wiele mniejszy od straty 
spowodowanej brakiem współpracy w następnych turach. Obie strony ze wzglę- 
dów psychologicznych są skłonne wybrać niekorzystny dla siebie wariant, chro- 
niąc się przed najgorszym z możliwych. Sytuacje sprzeczności interesów odpo- 
wiadające „„dylematowi więźnia” mogą się powtarzać. Chociaż zmienia się kon- 
tekst oraz partnerzy, można postawić pytanie: jakich skutków możemy oczeki- 
wać w dłuższej skali czasowej, czyli jaką przyjąć strategię długofalową — współ- 
pracy czy rywalizacji? 

Symulacje komputerowe działania strategii podczas wielokrotnego rozgry- 
wania „dylematu więźnia” dają możliwość zobaczenia, jaki jest ogólny rachunek 
zysków 1 strat przy stosowaniu różnych podejść. Politolog R. Axelrod ogłosił 
nawet turniej na najlepszą strategię, będącą kombinacją posunięć współpraca- 
rywalizacja w iteracji „dylematu więźnia . Wśród nadesłanych propozycji stra- 
tegii można było wyróżnić strategie uprzejme, które nigdy nie zdradzały jako 
pierwsze, strategie wredne, które notorycznie lub od czasu do czasu dopuszczały 
się zdrady, strategie pamiętliwe, które karały partnera za zdradę, strategie wiel- 
koduszne, które nie odpowiadały na atak serią odwetów. W turnieju, w którym 
każda strategia walczyła po kolei z wszystkimi innymi, zwyciężyła strategia 
psychologa A. Rapoporta o nazwie wet za wet, czyli zawsze zaczynaj od współ- 
pracy, a następnie powielaj posunięcia drugiej strony. Strategia wet za wet jest 
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strategią uprzejmą, gdyż nigdy jako pierwsza nie posuwa się do zdrady, a jedno- 
cześnie pamiętliwą, gdyż na atak odpowiada atakiem, ale wybacza zdradę 1 nie 
stosuje dalszych akcji prewencyjnych. Strategia ta wykazuje się odpornością na 
zdradę, partner stosujący bardziej „wredne” strategie otrzyma gorsze wyniki. 
Otrzymany przez A. Rapoporta wynik był zaprzeczeniem opinii o potrzebie 
twardej postawy i stosowania siły w sytuacjach konfrontacyjnych. Inne analizo- 
wane strategie to [21, s. 96-103]: 
— zawsze W, czyli zawsze stosujemy strategię W; 
— zawsze R, czyli zawsze stosujemy strategię R; 
— wet za dwa wety, czyli stosowanie strategii R dopiero po dwukrotnym 
zastosowaniu strategii R przez partnera; 
—  Tat-forTit, gdzie w pierwszym ruchu stosujemy strategię R, a następnie 
powtarzamy strategię drugiej strony. 


3. Koncepcja uogólnionej gry 


Przedstawimy najpierw w skrócie podstawowe pojęcia związane z koncepcją 
uogólnionej gry, tzn. definicję reguły, kompleksu reguł, podkompleksu, oraz 
uogólnionej gry . 

Przez L oznaczmy język, w którym występują zmienne oznaczające obiekty 
i metaobiekty. Przez FOR oznaczmy zbiór formuł języka Z. 

Definicja 1. Regułą” nazywamy dowolny element 

(X,Y,y) e (FIN(p(FOR)))” x FOR, 
gdzie: 
X — zbiór przesłanek (premises); 
Y — zbiór uzasadnień (justifications). 
Formułę y nazywamy wnioskiem (konkluzją) reguły (X,Y,y). 
Regułę rozumiemy następująco: 
Jeśli wszystkie elementy X zachodzą oraz wszystkie elementy Y mogą zajść, to 
mamy y. 

Definicja 2. Kompleksem reguł nazywamy zbiór otrzymany przez stosowa- 
nie następujących zasad: 

l. dowolny skończony zbiór reguł jest kompleksem reguł; 

2. jeśli C, C, są kompleksami reguł, to C, vC, oraz p(C,) są komplek- 

sami reguł; 

3. jeśli C,cC,, C, są kompleksami reguł, to C, jest również komplek- 

sem reguł. 


* Szerzej o uogólnionej grze i jej zastosowaniach traktują prace [1; 2; 3; 6; 7; 1; 18; 19]. 

Ś FIN(Z) oznacza rodzinę wszystkich skończonych podzbiorów zbioru Z, (Z) — zbiór potęgowy 
zbioru Z. Por. [10, s. 95-108]. Reguła jest tu traktowana bardziej ogólnie niż w klasycznym ujęciu, mia- 
nowicie przez regułę rozumiemy tzw. regułę w stylu Reitera (Reiter 's default rule). Por. [17, s. 81-132]. 
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Definicja 3. Powiemy, że kompleks reguł C jest podkompleksem kom- 
pleksu D, jeśli C=D lub C został otrzymany z D przez opuszczenie pew- 
nych (lub wszystkich) reguł w kompleksie D oraz opuszczenie zbędnych nawia- 
sów 1 wystąpień zbioru pustego. 

Przez uogólnioną grę G rozumiemy proces interakcji między graczami pełnią- 
cymi w tej grze określone role oraz pozostającymi ze sobą w pewnych relacjach. 
Grę G reprezentujemy przez kompleks reguł. Wśród podkompleksów tego kom- 
pleksu wyróżniamy cztery komponenty: MODEL(I,G) opisujący ogólne uwarun- 
kowania sytuacyjne gry, VALUE(I,G) — normy 1 wartości uznawane przez graczy, 
ACT(,G) — możliwości działania graczy, J(/,G) — sposób rozumowania, podej- 
mowania decyzji przez graczy, gdzie I — zbiór graczy. 

Gracze podczas przebiegu gry dokonują oceny danej sytuacji, gromadzą, 
przetwarzają informacje, podejmują decyzje itp. Istotne znaczenie w procesie 
interakcji odgrywa kompleks J(i,G) i -tego gracza oraz związana z nim funk- 
cja oceny [6; 7; 8:18]. 

Definicja 4. Niech J(i, G) będzie kompleksem oceny i- tego gracza w grze G, 
a U = ((a,. A> ,...,A, ): a, € 4, |- przestrzenią obiektów. Operację, która w sytuacji 
S, w momencie czasu £ wektorowi a = (a,,...,a,) eU przypisuje kompleks reguł 
otrzymany przez stosowanie reguł z kompleksu oceny J(i, G) , nazywamy funkcją 
oceny tego gracza. Operację oznaczamy przez /f,(i,t,G), ajej wynik na obiekcie 


a przez f,(i,t, G)(a). 

Funkcja oceny /,(i,t,G) jest wyznaczona przez proces oceny, czyli ciąg 
działań określonych na obiekcie a=(ay,,...,a,)eU' z wykorzystaniem reguł 
z J(i,G) w kontekście sytuacji S,. 

W analizie rozwiązań uogólnionej gry dużą uwagę zwraca się na związek 
między rolami pełnionymi przez graczy, zależnościami między nimi, a procesem 
interakcji. Rozważane są różne typy zachowań gracza, co w konsekwencji pro- 
wadzi do wielu typów równowag. Wyróżniamy między innymi zachowanie ru- 
tynowe, instrumentalne, normatywne, podyktowane emocjami lub kombinacje 
wymienionych [7; 18]. 


4. Analiza „dylematu więźnia” w oparciu o kompleksy reguł 


Kompleksy reguł wykorzystamy do opisu oraz analizy rozwiązań gry „dyle- 
mat więźnia” ze względu na wybrane relacje między graczami [5; 7; 18]. 

Przez: 

— G oznaczmy kompleks reguł reprezentujących tę grę; 

—  [={1,2} -zbiór graczy; 

— — MODEL(i,G) — kompleks model i — tego gracza w grze G; 


ACT(i, G) — kompleks aktywności i — tego gracza w grze G; 
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— — MODEL(i,G) — kompleks wartości i — tego gracza w grze G; 

—  J(i,G) — kompleks oceny i — tego gracza w grze G; 

gdzie i e I = {1,2}. 

Główne komponenty G opiszemy w oparciu o następujące atrybuty: 

Zbiór graczy: Í. 

Układ strategii: (dla 7 =41,2)): (a,,a,), gdzie a, — strategia i —tego gracza, 
a, e(W,R; ie]. 

Wypłaty: p(a,,a, ) = (w,,w,), gdzie w, — wypłata i — tego gracza, i€ T. 
Charakter relacji między stronami: brak relacji, solidarność, rywalizacja, 
WTOgOŚĆ. 

Status stron: symetryczny, asymetryczny. 

Komunikacja: brak komunikacji, komunikacja dozwolona. 

Informacja o kompleksach drugiej strony: pełna, częściowa, zupełny brak. 
Kolejność posunięć: równocześnie, rozpoczyna gracz I, rozpoczyna gracz II. 
Kryterium osiągnięcia celu: maksymalizacja własnej wygranej, maksymaliza- 
cja różnicy wypłat, maksymalizacja wspólnej wygranej. 

Przez f,(i,t,G) oznaczymy funkcję oceny i — tego gracza, która parze stra- 
tegii (a,,a,) w sytuacji S, w grze G przypisuje stopień realizacji normy wyzna- 
czonej przez regułę ve VALUE(i,G), gdzie a, € {W,R}, i=1,2. Dla uprosz- 
czenia będziemy pisali /,(i,t)((a,b).v). 

Do opisu gry wykorzystamy następujące reguły: 

n =0,0,1=4112)); 

= (((układ strategii :(W,W)),©, wypłaty :p(W,W)=(c,c), a<b<c<d]; 
(((układ strategii :(W,R)),G, wypłaty: p(W,R)= (a,d),a<b<c<d l; 


p= 
r, = f((układ strategii :(R,W)}, Ø, wypłaty: ọ(R,W) =(d,a)a<b<c<d}; 
j= (((układ strategii :(R,R)),G, wypłaty : p(R,R)=(b,b),a<b<c<d F 
r = fbrak relacji „O, indywidualna racjonalność) ; 

r; = { {indywidualna racjonalność; ,O, vı} ; 


r = { {maksymalizacja wł asnej wygranej) , O, równowaga Nasha; ; 
ł, = ((gracze są solidarni i O, ył; 

hy ((gracze są rywalami, O, V, b; 

nı = ((gracze są wrogami}, O, vy; 

hp = (igracz I ma przewagę nad graczem II) „O, Vos Ve e 

Fęk = (Z, Ø, komunikacja : brak}; 

Pg = (Z, ©, komunikacja : dozwolona); 


rog = (9, Ø, kolejność posunięć : równocześnie}; 
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For = (Z, ©, kolejność posunięć : rozpoczyna I gracz) f 

Fry = (Z, O, kolejność posunięć : rozpoczyna II gracz); 

op = (Z, (O, informacja o kompleksach drugiej strony : peł na) ; 

ha" (Z, O, informacja o kompleksach drugiej strony : niepeł na); 

Pps D „O, brak relacji między graczami}; 

r = (2 „O, gracze są solidarni względem siebie); 

hy = D „O, gracze są wrogami}; 

h= (3 „O, gracze są rywalami); 

Fis = ( (0,0, gracz I ma przewagę nad graczem II) ; 

y= (2 „O, każda ze stron maksymalizuje własną wygraną | i 

v, = {Ø, Ø, wybierz współpracę; ; 

V = (2 , ©, maksymalizuj różnicę wypłat na swoją korzyść | > 

= (2 O, 2- 

y4 — maksymalizuj różnicę wypłat na swoja korzyść, staraj się zranić drugą 
stronę; 

vs = (Ø, Ø, Ys}; 

y; —maksymalizuj własną wypłatę, druga strona zgadza się na maksymalizację 
tej wypłaty; 

v =10,0, Ye}; 

Y — zgoda na maksymalizację wypłaty drugiej strony; 

R, — kompleks reguł opisujący sposób wyznaczania równowagi Nasha; 

R, — kompleks reguł związany z wyznaczaniem różnicy wypłat; 

Rgs — kompleks reguł związanych z możliwością stosowania ruchów strategicz- 
nych; 

R, — pozostałe reguły regulujące przebieg gry. 


I. „Dylemat więźnia” w sytuacji braku relacji społecznych między 
graczami 

Komponenty kompleksu G mają postać: 

— _ MODEL(I,G) = MODEL(2,G) = fir, : k = 1,2,3,4,5), rep» Fok+TpR>Tpr |; 

—  VALUE(I,G)=VALUEQ2,G) = $y, : k = 1,2,3,4,5,6) ; 

—  ACT(LG)= ACT(2,G) = W Ry; 

-  J(LG)=|R;,Ry, Ręs,R,, J(1,t), {r,: gdzie k=6,7,8,9,10,11,12)]; 

-  J(2,G6)=(R,R,,Rzs, R,,J(2,1), (r: gdzie k=6,7,8,9,10,11,12)]. 
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W sytuacji braku relacji między graczami obie strony traktujemy jako racjo- 
nalnych egoistów, którzy postępują zgodnie z normą reprezentowaną przez v,. 
Indywidualne funkcje oceny prowadzą do wyznaczenia równowagi Nasha zgod- 
nie z regułami zawartymi w kompleksie R, . Możliwości działania graczy są upo- 


rządkowane przez ich indywidualne funkcje oceny następująco: 
JW (R, R), vi) > J AXR, W), v) = ALAW, W), vi) = AAD, R), v), 
Ja (ICR, R), v1) > JAW R), v) = fi AWW), v) = ARW), v). 


Każdy z graczy wybiera strategię rywalizacyjną R, spodziewając się, że druga 
strona również wybierze tę strategię. 


II. „Dylemat więźnia” w sytuacji, gdy gracze są solidarni względem 

siebie 

Sp kompleksu G mają postać: 

MODEL(I, G) = MODEL(2,G) = (fr, : k =1,2,3,4,5}, fs» FgK» pr tpr}; 

—  VALUE(, G) = VALUE(2,G) = {v, : k =1,2,3,4,5,6} ; 

— ACT(,G)= ACT(2,G)={W, 

-  J(LG)=(R,,R,, Rgs, R,, JOD), tr, : gdzie k= 6,7,8,9,10,11,12}}; 

-  J(2,G)=(R,,Ry, Rgs, R,,J(2,1), fr, : gdzie k = 6,7,8,9,10,11,12}}. 

W sytuacji relacji solidarności gracze wybierają współpracę, postępując 
zgodnie z normą reprezentowaną przez v,. Indywidualne funkcje oceny porząd- 
kują ich możliwości działania następująco: 

JLI(W.,W)v,) > F10, tX, R), v2) = fiL, R), v2) = f,(1,1)((RW)„v,).. 
Sa, AWW), v) > Ji (AO, R), v) = Ji (2, 1tX(R, R), v2) = Ji (2:tX(R,W), v, 


Gracz I wybiera współpracę, spodziewając się, że gracz II również wybierze 
współpracę. 


III. „Dylemat więźnia” w sytuacji, gdy gracze są rywalami. 
Komponenty kompleksu G mają postać: 

—  MODEL(I,G) = MODEL(2,G) = (fr, : k = 1,2,3,4,5), rę» Tek »TersTer 3 
— _ VALUE(I,G) = VALUEQ2,G) = {v, : k = 1,2,3,4,5,6) ; 

—  ACT(LG)= ACT(Q2,G) = (WR; ; 

-  J(,G)=(R,,Ry, Rgs R, J(L0), (r, : gdzie k=6,7,8,9,10,11,12)|; 
—  J(2,6)= (RR, ,Rzs „R, J(2,t), fr, : gdzie k =6,7,8,9,10,11,12)). 


ostępniono w ramach projektu za 
naukowych ja m Uniw w Białyr 
k Tia ikac i Nau akt a podst ry SONB/SP/512497/2021 


Analiza „dylematu więźnia” z wykorzystaniem kompleksów reguł 227 


W sytuacji rywalizacji między stronami obaj gracze postępują zgodnie z nor- 
mą reprezentowaną przez v, . Indywidualne funkcje oceny porządkują ich możli- 


wości działania w oparciu o reguły z kompleksu R, następująco: 


JMD(R,W),v;) > fiA, XCR, R), v3) = fA, AW, W), v3) > fiQ, AAW, R), v3), 
Ji, tW, R), v3) > fi (2, tX(R, R), v3) = fi (2, tW, W), v3) > f (2,((R,W),v;). 


Każdy z graczy wybierze strategię rywalizacyjną, co doprowadzi do wyniku (R, R). 


IV. „Dylemat więźnia” w sytuacji, gdy gracze są wrogami. 
A kompleksu G mają postać: 
MODEL(I, G) = MODEL(2,G) = (fr, : k =1,2,3,4,5), ry Fęk Top» pr b; 

—  VALUE(1, G) = VALUE(2,G) = 4v, : k =1,2,3,4,5,6; ; 

—  ACT(,G)=ACT(2,G)=W Ry; 

-  J(LG)= (RR, Ręs, R, JOD), fr, : gdzie k =6,7,8,9,10,11,12)|; 

-  J(2,G6)=(R,,R;, Rgs, R,, J(2,t), r, : gdzie k =6,7,8,9,10,11,12)|. 

W sytuacji wrogości między stronami obaj gracze postępują zgodnie z normą 
reprezentowaną przez v,. Indywidualne funkcje oceny porządkują ich możliwo- 


ści działania w oparciu o reguły z kompleksu R, następująco: 


JA, tX((R, W), v4) > Sy (1,4)((R, R), v4) > JQ, AW, W), v4) = Sj (1, X(W, R), v4) , 
Ja (2, AW, R), v4) > Jy (2R, R), v4) > J;(2,1Y(W,W),v,) = Jy(2,1)((RW ),v,). 


Każdy z graczy wybiera R , spodziewając się, że druga strona również wybierze R. 


V. „Dylemat więźnia” w przypadku graczy o asymetrycznym 
statusie 

i kompleksu G mają postać: 
MODEL(I, G) = MODEL(2,G) = (tr, : k =1,2,3,4,5), rys Pęk +TpR>Fpr l; 

—  VALUE(I,G) = VALUE(2, G) = {v, :k=1,2,3,4,5,6; ; 

—  ACT(LG)=ACT(2,G) =+W,R;; 

-  J(LG)=LR,,R;, Rps, R, J(L0), {r,: gdzie k=6,7,8,9,10,11,12)); 

-  J(2,G)=(R,,R,, Rgs, R,,J(2,1), fr, : gdzie k =6,7,8,9,10,11,12)|. 

W tej sytuacji gracz I postępuje zgodnie z normą wyznaczoną przez regułę 

v; , a gracz II zgodnie z normą wyznaczoną przez regułę v. Indywidualne funk- 


cje oceny porządkują ich możliwości działania w oparciu o reguły z kompleksu 
R, następująco: 
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JI (1,£)((R,W ), vs) > J0, O((R, R), vs) = Íy (AW, W), vs) > Í (1,4A(W, R), vs) b 
fk, t)((R, W ),v5) > JI (2,)((R, R), vs) = JI (2,4)((W „W ),v;) > Í (2, Ó(W,R),v;). 


Gracz I wybiera R, spodziewając się, że gracz II wybierze W . Gracz II 
wybierze W , spodziewając się, że gracz I wybierze R, zatem rozwiązaniem gry 
jest para strategii (R,W ). 

Zestawienie rozwiązań gry „dylemat więźnia” w zależności od relacji między 
stronami przedstawia tabela 2. 


Tabela 2. Rozwiązania gry „dylemat więźnia” w zależności od relacji między 
stronami 
Role pełnione 


przez graczy/ 
ac 


Charakterystyka reguł 
determinujących sposób Rozwiązanie gry 
postępowania gracza 


Każdy z graczy postępuje zgodnie| Rozwiązaniem gry jest równowaga Nasha, 
Racjonalni |z regułą maksymalizacji wypłat |której odpowiada para strategii (R,R). Roz- 
egoiści przy założeniu, że drugi z graczy|wiązanie nie spełnia oczekiwań żadnej ze 


Solidarność 


Rywalizacja |Każdy z graczy dąży do maksy-|Rozwiązaniem gry jest para strategii (R,R). 
malizacji różnicy wypłat pomię-|Rozwiązanie nie spełnia oczekiwań żadnej 
dzy nimi. ze stron. Rozwiązaniem pożądanym przez| 

g , oracza II (W,R). 

W rogość Każdy z graczy dąży do maksy-|Rozwiązaniem gry jest para strategii (R,R). 
malizacji różnicy wypłat pomię-|Rozwiązanie nie spełnia oczekiwań żadnej 
dzy nimi z jednoczesnym zranie-|ze stron. Rozwiązaniem pożądanym przez 

przeciwnika. gracza I jest (R, W), a gracza II (W,R). 

Asymetryczny |Gracz I dąży do maksymalizacji|Rozwiązaniem gry jest (R, W). Rozwiązanie 

status stron |własnej wypłaty. Gracz II zgadzajto jest akceptowane przez obie strony. 
się na maksymalizację wypłaty 
gracza I. 


Dokonamy teraz analizy rozwiązań gry „dylemat więźnia”, biorąc pod uwagę 
możliwość komunikacji między stronami w sytuacji, gdy jeden z graczy rozpo- 
czyna grę jako pierwszy oraz gracze mają pełną informację o kompleksach dru- 
giej strony. 


VI. „Dylemat więźnia” w sytuacji, gdy jeden z graczy rozpoczyna 
grę jako pierwszy, ale brak jest komunikacji między stronami 


Komponenty kompleksu G mają postać: 
— _ MODEL(I,G) = MODEL(2, G) = $fr, : k = 1,2,3,4,5), FeR Tak >TeisTpr |; 
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—  _ VALUE(1,G) =VALUE(2,G) = 4v, : k=1,2,3,4,5,6; ; 

—  ACTQ,G)=ACT(2,G)=+WR;; 

-  J(1,G)=(R,,R,, Rgs: R, J(l,t), (r, : gdzie k =6,7,8,9,10,11,12)); 

—  J(2,6)=(R,R,, Rzęs, R,,J(2,9), (r, : gdzie k =6,7,8,9,10,11,12}}. 

Jeżeli grę rozpoczyna gracz I oraz obaj gracze są nastawieni na maksymali- 
zację własnej wygranej, to postępują zgodnie z normą reprezentowaną przez v). 


Możliwości działania graczy są uporządkowane przez ich indywidualne funkcje 
oceny następująco: 


JIQ, ACR, R), vi) > LNR, W), v) = A ALAW, W), v) = AAO, R), v), 
Js (2, tX(R, R), vi) > fy, AW, R), vi) = fy, AW, W), vi) = fi (2, (R,W), v). 


Rozwiązaniem gry będzie para strategii (R, R). 


VII. „Dylemat więźnia” w sytuacji, gdy jeden z graczy rozpoczyna 
grę jako pierwszy i dopuszczamy możliwość komunikacji między 
stronami 


Komponenty kompleksu G mają postać: 

—  MODEL(I, G) = MODEL(2,G) = ffr, : k =1,2,3,4,5), rę» ToksTęrsTpr y; 

—  VALUE(,G)=VALUE(2,G) = {v, :k=1,2,3,4,5,6; ; 

—  ACTQ,G)=ACT(2,G)=+W R;; 

-  J(LG)=(R,R,, Rgs, R,,J(L1), (r: gdzie k=6,7,8,9,10,11,12)) ; 

-  J(2,G6)=(R,,R,, Rzy, R,,J(2,1), fr, : gdzie k =6,7,8,9,10,11,12)). 
Gracze w oparciu o kompleks reguł Rgs analizują możliwości ruchów strate- 


gicznych. W grze nie da się sformułować żadnej groźby, gdyż niezależnie od 
wyboru jednego z graczy, drugiemu z nich opłaca się stosować strategię „gor- 
szą” dla oponenta. Zatem żaden z graczy nie może grozić drugiej stronie. W tej 
grze pozytywny skutek może odnieść natomiast obietnica. Gracz II może zasto- 
sować wobec gracza I obietnicę: „jeśli zagrasz W, to ja zagram W”. W sytuacji, 
gdy druga strona uwierzy w obietnicę, to rozwiązaniem gry będzie para strategii 
(W,W), na czym zyskają obie strony. 

Strategie mogą być opisane przez odpowiednie reguły lub kompleksy reguł 
oraz uzupełnione o szczegółowe reguły/kompleksy reguł określające warunki 
ich stosowania. Wybór określonej strategii działania dla gry iterowanej zależy 
między innymi od relacji między stronami, cech osobowościowych graczy, ilo- 
ści powtórzeń gry, struktury macierzy wypłat itp. Metodą uwiarygodnienia sto- 
sowania określonych ruchów strategicznych może być przyjęcie niskich wypłat 
w kilku pierwszych grach, aby uwiarygodnić obietnice lub groźby w następnych. 
Jeżeli brak jest bezpośredniej komunikacji między stronami, to możliwe jest 
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przekazanie pewnych komunikatów drugiej stronie poprzez stosowanie odpo- 
wiedniej strategii. Przykładowo strategia wet za wet może być rozumiana jako: 
„jeśli będziesz współpracował, ja też będę współpracował” oraz „jeśli nie bę- 
dziesz współpracował, ja też nie będę współpracował. 

Możemy analizować pewne uogólnienia rozważanych gier. Kompleksy reguł 
mogą być rozbudowane przez wprowadzenie nieprecyzyjnych reguł gry, nie- 
kompletnej informacji, złożonych motywów postępowania graczy itp. 


5. Uwagi końcowe 


Wiele sytuacji w życiu i biznesie ma właściwości podobne do „dylematu 
więźnia”. Przykładem może być sytuacja konkurujących ze sobą sklepów. Wła- 
ściciele muszą zdecydować, czy obniżyć ceny. Jeśli ja obniżę ceny, a konkuren- 
cyjny sklep ich nie obniży, przyciągnie to klientów do mojego sklepu. Jeśli 
konkurencyjny sklep obniży ceny, należy również je obniżyć, żeby nie stracić 
klientów. W sytuacji, gdy oba sklepy obniżą ceny, oba będą miały mniejsze zy- 
ski, niż gdyby ceny zostały na poprzednim poziomie. Inne przykłady zastosowań 
to: negocjacje, podział zasobów, konfrontacja związki zawodowe — zarząd 
firmy, analiza procesu rozbrojenia, stosunków międzypartyjnych, czy też korup- 
cji [15, s. 234-236]. 

Narzędzia reguł i kompleksów reguł prezentowane w tej pracy pozwalają na 
pełniejszą analizę sytuacji konfliktowej, opis uwarunkowań zewnętrznych, mo- 
tywów postępowania graczy, relacji między nimi, działań skłaniających strony 
do podejmowania współpracy. 
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